Site cover image

Site icon imageSen(Qian)’s Memo

This website is Donglin Qian (Torin Sen)’s memo, especially about machine learning papers and competitive programming.

2024-WWW-Optimal Engagement-Diversity Tradeoffs in Social Media

https://dl.acm.org/doi/10.1145/3589334.3645713

Proceedings of the ACM on Web Conference 2024という会議。

Introduction

Echo Chamber就是一直看和自己论点相同的意见会造成“自己的论点非常被支持”样的错觉,会导致政治思想极化。

但是,越echo chamber用户就越活跃=engagement越高。这里有一个问题就是为了防止echo chamber我们需要diversity,但是diversity会把平台降温。

这篇文章考虑了这样的trade-off 他们在保持一定的diversity的情况下提出一个engagement最大化问题的解法。

proposed method是这样的

  • Social Network是有向图
    • 每个tweet都有类型一共有TT种,而每个用户的RT各种的tweet的概率也被事前定义的。
  • Markov Decision Model。
  • Engagement是把时间扩大为infty的情况下的RT数量,因为圈子有限的话总归会传到所有人,而想RT的人肯定就RT了。
  • proposed method提出了
    • 只把engagement最大化的策略
    • 保持一定diversity的情况下把engagement最大化的策略
  • 主要结果如下
    • 每个用户对于每种类型的tweet,都至少有概率α\alpha会RT
    • 每个用户对于每种类型的tweet,都之多有概率β\beta会RT
    • Tweet一共有TT
    • δ\delta代表每个用户会接触到的各种Tweet在占有全体接触到的Tweet中,最少的种类的ratio。
      • 最多就是1/T1/T都看到。最少就是0,代表有些类型的Tweet一句都没看到。
      • 可以说δ\delta就是一个diversity指标,越高越有diversity。
      • 而保证diversity在这里也就是保证δ\delta不低于某个数字。
    • 实际上的tweet的数据集上,这个理论也是挺正确的。

Model And Machinery

定义

  • ptjp_{tj}是用户jj在看到Tweet的时候RT的概率。这个判断需要时间1
  • 一共考虑的是时间TT \to \infty以后的事情。
  • 如果用户iijj给follow,他将会看到jjRT的Tweet。但是定义上看到上面是从所有following(i)following(i)也就是ii所follow的所有人上等概率抽选,所以就是ii转发从jj那里看到的Tweet的概率是
Image in a image block

用MatrixAA可以表现这个,而policy通过bt[0,1]n\mathbf{b}_t \in [0,1]^n来指定给用户种类tt的Tweet的预期数量。btib_{ti}是给用户iitt类型的Tweet的ratio。

之后就因为可以写成这样 下面是简略。

xk+1=Atxk+btxk+1=Axk+b\mathbf{x}^{k+1} = A_t \mathbf{x}^k + \mathbf{b}_t \\ \mathbf{x}^{k+1} = A \mathbf{x}^k + \mathbf{b}

这样就可以线性解出来。成为xt=(IAt)1bt\mathbf{x}_t = (I-A_t)^{-1}\mathbf{b}_t

Engagement是什么

对于情况xt\mathbf{x}_t与RT概率pt\mathbf{p}_t他们的inner product成为engagement

The Engagement Diversity Trade-off in Practice

Image in a image block

x轴是保证的diversityδ\delta,y轴是需要付出百分之多少的engagement。

Scaling Factor是相当于Matrix AA,Incoming Retweets是相当于b。操控这两个都有效果。

据说在real dataset里面一个例子就是牺牲5%的engagement,来获得0.03的diversity。

实际上不错。